对表示形式的研究对于任何形式的交流都是至关重要的,我们有效利用它们的能力至关重要。本文介绍了一种新颖的理论 - 代表性系统理论 - 旨在从三个核心角度从三个核心角度进行抽象地编码各种表示:语法,综合及其属性。通过介绍建筑空间的概念,我们能够在一个统一的范式下编码这些核心组件中的每个核心组件。使用我们的代表性系统理论,有可能在结构上将一个系统中的表示形式转换为另一个系统的表示形式。我们结构转化技术的固有方面是根据表示的属性(例如它们的相对认知有效性或结构复杂性)的代表选择。提供一般结构转化技术的主要理论障碍是缺乏终止算法。代表系统理论允许在没有终止算法的情况下衍生部分变换。由于代表性系统理论提供了一种通用编码代表系统的通用方法,因此消除了进一步的关键障碍:需要设计特定于系统的结构转换算法,这是当不同系统采用不同的形式化方法时所必需的。因此,代表性系统理论是第一个提供统一方法来编码表示形式,通过结构转换支持表示形式的第一个通用框架,并具有广泛的实用应用。
translated by 谷歌翻译
Calculating an Air Quality Index (AQI) typically uses data streams from air quality sensors deployed at fixed locations and the calculation is a real time process. If one or a number of sensors are broken or offline, then the real time AQI value cannot be computed. Estimating AQI values for some point in the future is a predictive process and uses historical AQI values to train and build models. In this work we focus on gap filling in air quality data where the task is to predict the AQI at 1, 5 and 7 days into the future. The scenario is where one or a number of air, weather and traffic sensors are offline and explores prediction accuracy under such situations. The work is part of the MediaEval'2022 Urban Air: Urban Life and Air Pollution task submitted by the DCU-Insight-AQ team and uses multimodal and crossmodal data consisting of AQI, weather and CCTV traffic images for air pollution prediction.
translated by 谷歌翻译
语义是遗传编程(GP)研究的越来越多的领域,是指执行遗传编程人员的行为输出。这项研究通过提出一种新方法来扩展对语义的当前理解:基于语义的距离作为附加标准(SDO),在迄今为止,多目标GP(MOGP)中的语义研究领域有限有限。我们的工作包括在性能和多样性指标方面对GP进行广泛的分析,使用了另外基于语义的方法,即基于语义相似性的跨界(SCC)和基于语义的拥挤距离(SCD)。每种方法都集成到两个进化的多目标(EMO)框架中:非主导的分类遗传算法II(NSGA-II)和强度帕累托进化算法2(SPEA2),以及三种语义方法,即三种语义方法NSGA-II和SPEA2进行了严格的比较。我们使用高度不平衡的二元分类数据集,我们证明了SDO的新提出的方法始终生成更非主导的解决方案,具有更好的多样性和改进的超量结果。
translated by 谷歌翻译
Motivated by the growing importance of reducing unfairness in ML predictions, Fair-ML researchers have presented an extensive suite of algorithmic 'fairness-enhancing' remedies. Most existing algorithms, however, are agnostic to the sources of the observed unfairness. As a result, the literature currently lacks guiding frameworks to specify conditions under which each algorithmic intervention can potentially alleviate the underpinning cause of unfairness. To close this gap, we scrutinize the underlying biases (e.g., in the training data or design choices) that cause observational unfairness. We present the conceptual idea and a first implementation of a bias-injection sandbox tool to investigate fairness consequences of various biases and assess the effectiveness of algorithmic remedies in the presence of specific types of bias. We call this process the bias(stress)-testing of algorithmic interventions. Unlike existing toolkits, ours provides a controlled environment to counterfactually inject biases in the ML pipeline. This stylized setup offers the distinct capability of testing fairness interventions beyond observational data and against an unbiased benchmark. In particular, we can test whether a given remedy can alleviate the injected bias by comparing the predictions resulting after the intervention in the biased setting with true labels in the unbiased regime-that is, before any bias injection. We illustrate the utility of our toolkit via a proof-of-concept case study on synthetic data. Our empirical analysis showcases the type of insights that can be obtained through our simulations.
translated by 谷歌翻译
在机器学习(ML)算法自动化或提供有关人员的后果决策的环境中,通常会激励个人决策主题以战略性地修改其可观察的属性以获得更有利的预测。结果,对评估规则进行培训的分布可能与其部署中运营的规则不同。尽管这种分配的变化通常可以阻碍准确的预测,但我们的工作确定了由于战略反应而引起的转变相关的独特机会:我们表明我们可以有效地利用战略反应来恢复可观察到的特征与我们希望预测的可观察到的因果关系,即使在没有观察到的混杂变量的情况下。具体而言,我们的工作通过观察到部署模型的序列可以看作是影响代理可观察到的特征但不会直接影响其结果的工具,从而建立了对ML模型的战略响应与仪器变量(IV)回归之间的新颖联系。我们表明,我们的因果恢复方法可用于改善几个重要标准的决策:个人公平,代理结果和预测风险。特别是,我们表明,如果决策主体在修改非毒物属性的能力上有所不同,那么与因果系数偏离的任何决策规则都可能导致(潜在无限)个体级别的不公平性。
translated by 谷歌翻译
语义已成为遗传编程(GP)研究的关键话题。语义是指在数据集上运行时GP个体的输出(行为)。专注于单目标GP中语义多样性的大多数作品表明它在进化搜索方面是非常有益的。令人惊讶的是,在多目标GP(MOGP)中,在语义中进行了小型研究。在这项工作中,我们跨越我们对Mogp中语义的理解,提出SDO:基于语义的距离作为额外标准。这自然鼓励Mogp中的语义多样性。为此,我们在第一个帕累托前面的较密集的区域(最有前途的前沿)找到一个枢轴。然后,这用于计算枢轴与人群中的每个人之间的距离。然后将所得到的距离用作优化以优化以偏及语义分集的额外标准。我们还使用其他基于语义的方法作为基准,称为基于语义相似性的交叉和语义的拥挤距离。此外,我们也使用NSGA-II和SPEA2进行比较。我们使用高度不平衡二进制分类问题,一致地展示我们所提出的SDO方法如何产生更多非主导的解决方案和更好的多样性,导致更好的统计学显着的结果,与其他四种方法相比,使用超卓越症结果作为评估措施。
translated by 谷歌翻译